DatumBox - 机器学习、统计和软件开发博客领域信息情报检索

Datumbox博客专注于机器学习、统计学、人工智能及其在软件开发和在线营销中的应用。

vernamveil:基于函数的加密

VernamVeil: A Fresh Take on Function-Based Encryption

密码学通常感觉像是一种古老的黑暗艺术,充满了数学繁重的概念,刚性的钥匙尺寸和严格的协议。但是,如果您可以完全重新考虑“密钥”的想法,该怎么办?如果钥匙不是固定的斑点,而是一个活着的呼吸功能怎么办? vernamveil是一个实验性密码,可以准确探索这个想法。 […]

TorchVision 现代化之旅 – TorchVision 开发人员回忆录 – 3

The journey of Modernizing TorchVision – Memoirs of a TorchVision developer – 3

TorchVision v0.11 预览 – TorchVision 开发者回忆录 – 2

A sneak peek at TorchVision v0.11 – Memoirs of a TorchVision developer – 2

过去几周,“PyTorch Land”非常忙碌,因为我们正在疯狂地准备 PyTorch v1.10 和 TorchVision v0.11 的发布。在本系列的第二部分中,我将介绍 TorchVision 发布分支中目前包含的一些即将推出的功能。免责声明:虽然即将发布的版本包含 […]

新博客系列 - TorchVision 开发人员回忆录

New Blog series – Memoirs of a TorchVision developer

我将开始撰写有关 PyTorch 计算机视觉库开发的新博客文章系列。我计划主要讨论 TorchVision 和 PyTorch 生态系统中即将推出的有趣功能。我的目标是重点介绍新功能和正在开发的功能,并阐明发布期间发生的事情。虽然格式可能 […]

如何使用Ubuntu 20.10 上的 DejaDup

How to take S3 backups with DejaDup on Ubuntu 20.10

DejaDup 是 Gnome 的默认备份应用程序。它是 duplicity 的 GUI,专注于简单性,支持增量加密备份,并且直到最近还支持大量云提供商。不幸的是,从 42.0 版开始,所有主要的云提供商都已被删除。因此,鉴于 Ubuntu 20.10 附带特定版本,任何用户 […]

Datumbox 机器学习框架 v0.8.2 发布

Datumbox Machine Learning Framework v0.8.2 released

Datumbox Framework v0.8.2 已发布!立即从 GitHub 或 Maven Central Repository 下载。有什么新东西?版本 0.8.2 是一个有限的增量版本,专注于解决错误和更新框架的依赖项。以下是详细信息:错误修复:解决了 ShapiroWilk 上导致错误的问题 […]

如何绕过 Linux 上的 Dropbox 符号链接限制

How to get around Dropbox’s symlink limitations on Linux

截至 2019 年中,Dropbox 宣布他们不再支持指向主 Dropbox 文件夹之外的符号链接。在本教程中,我们展示了 Linux 上的一种解决方法,使我们能够在 Dropbox 中存储任何文件,即使它不在主 Dropbox 文件夹中。有什么限制,为什么它是 […]

Keras 的批量规范化层已损坏

The Batch Normalization layer of Keras is broken

更新:不幸的是,我向 Keras 发出的改变批量规范化层行为的 Pull 请求未被接受。您可以在此处阅读详细信息。对于那些敢于尝试自定义实现的人,您可以在我的分支中找到代码。我可能会维护它并将其与最新的 […] 合并

使用 Keras 进行多 GPU 训练的 5 个技巧

5 tips for multi-GPU training with Keras

深度学习(2010 年代后期最受欢迎的流行词,与区块链/比特币和数据科学/机器学习一起)使我们在过去几年中做了一些非常酷的事情。除了算法的进步(诚然,这些进步是基于自 1990 年代即“数据挖掘时代”以来已知的思想)之外,其成功的主要原因可以 […]

Ubuntu 17.10:最后一分钟评论

Ubuntu 17.10: a last minute review

2017 年 10 月 19 日,Ubuntu 17.10 将发布,很多人都知道它包含许多重大变化。我花了一周时间测试 Beta 2,在这篇“最后一分钟”评论中,我记录了 Ubuntu 17.10 中一些不太明显的功能/陷阱。我还与您分享了我的经验,并提供 [...]

Datumbox 机器学习框架 v0.8.1 发布

Datumbox Machine Learning Framework v0.8.1 released

Datumbox v0.8.1 已发布!立即从 Github 或 Maven Central Repository 下载。 有什么新东西? 0.8.1 版本的主要重点是解决各种错误、更新依赖项并改进框架的代码架构。以下是详细信息:依赖项:更新了 Maven Compiler、Nexus Staging、Surefire、SLF4J 和 Logback […]

深入研究 Spark 的 ALS 推荐算法

Drilling into Spark’s ALS Recommendation algorithm

Hu 等人提出的 ALS 算法是推荐系统问题中非常流行的技术,尤其是当我们有隐式数据集(例如点击、喜欢等)时。它可以相当好地处理大量数据,我们可以在各种机器学习框架中找到许多很好的实现。Spark 将该算法包含在 […]

使用 Linux dstat 工具获取 NVIDIA 卡的 GPU 使用情况

Getting the GPU usage of NVIDIA cards with the Linux dstat tool

dstat 是一个很棒的小工具,它允许您获取 Linux 机器的资源统计信息。它具有模块化架构,允许您开发其他插件,并且易于使用。最近,我正在分析使用 Keras 和 Tensorflow 开发的深度学习管道,我需要有关 […] 的详细统计数据

Datumbox 机器学习框架版本 0.8.0 发布

Datumbox Machine Learning Framework version 0.8.0 released

Datumbox Framework v0.8.0 已经发布,并包含几个强大的功能!此版本带来了新的预处理、特征选择和模型选择算法、新的强大存储引擎,可以更好地控制模型和数据帧的保存/加载方式、几个预先训练的机器学习模型以及大量内存和速度改进。立即从 Github 下载 […]

Datumbox 机器学习框架 0.7.0 发布

Datumbox Machine Learning Framework 0.7.0 Released

我很高兴地宣布,经过几个月的开发,Datumbox 的新版本已经发布!0.7.0 版本带来了多线程支持、针对不适合内存的数据集的快速基于磁盘的训练、一些算法增强和更好的架构。立即从 Github 或 Maven Central Repository 下载。有什么新东西?焦点 […]

Datumbox 机器学习框架 0.6.1 发布

Datumbox Machine Learning Framework 0.6.1 Released

Datumbox 机器学习框架的新版本已发布!立即从 Github 或 Maven Central Repository 下载。 有什么新东西? 0.6.1 版本的主要重点是解决各种错误、减少内存消耗并提高速度。让我们详细了解一下此版本的变化:错误修复:与 […] 相关的小问题

Datumbox 机器学习框架 0.6.0 发布

Datumbox Machine Learning Framework 0.6.0 Released

Datumbox 机器学习框架的新版本已经发布!立即从 Github 或 Maven Central Repository 下载。有什么新东西?0.6.0 版本的主要重点是扩展框架以处理大数据、改进代码架构和公共 API、简化数据解析、增强文档并转向 […]

如何安装和使用 Datumbox 机器学习框架

How to install and use the Datumbox Machine Learning Framework

在本指南中,我们将讨论如何在 Java 项目中安装和使用 Datumbox 机器学习框架。由于几乎所有代码都是用 Java 编写的,因此使用它就像将其作为依赖项包含在 Java 项目中一样简单。尽管如此,有几个类(DataEnvelopmentAnalysis 和 LPSolver)使用 […]